学了一些多模态的知识,CLIP算是其中最重要也是最通用的一环,一起来看一下吧。CLIP的全称是ContrastiveLanguage-ImagePre-Training,中文是对比语言-图像预训练,是一个预训...
浏览 98 次 标签: 多模态模型学习1——CLIP对比学习 语言-图像预训练模型